makine öğrenimi ne demek?

Makine öğrenimi veya makine öğrenmesi, bilgisayarların algılayıcı verisi ya da veritabanları gibi veri türlerine dayalı öğrenimini olanaklı kılan algoritmaların tasarım ve geliştirme süreçlerini konu edinen bir bilim dalıdır. Makine öğrenimi araştırmalarının odaklandığı konu bilgisayarlara karmaşık örüntüleri algılama ve veriye dayalı akılcı kararlar verebilme becerisi kazandırmaktır. Bu, makine öğreniminin istatistik, olasılık kuramı, veri madenciliği, örüntü tanıma, yapay zekâ, uyarlamalı denetim ve kuramsal bilgisayar bilimi gibi alanlarla yakından ilintili olduğunu göstermektedir.

Özet

Makine öğrenimi, bilgisayarların, açıkça programlanmadan görevleri nasıl yerine getirebileceklerini keşfetmelerini içerir. Belirli görevleri yerine getirmeleri için sağlanan verilerden öğrenen bilgisayarları kapsar. Bilgisayarlara atanan basit görevler için, makineye eldeki sorunu çözmek için gereken tüm adımları nasıl uygulayacağını bildiren algoritmalar programlamak mümkündür; bilgisayar tarafında öğrenmeye gerek yoktur. Daha gelişmiş görevlerde insan için gerekli algoritmaları elle oluşturmak zor olabilir. Uygulamada, insan programcıların gerekli her adımı belirlemesinden ziyade, makinenin kendi algoritmasını geliştirmesine yardımcı olmak daha etkili olabilir.1

Makine öğrenimi disiplini, bilgisayarlara tam olarak tatmin edici bir algoritmanın bulunmadığı görevleri gerçekleştirmeyi öğretmek için çeşitli yaklaşımlar kullanır. Çok sayıda olası yanıtın olduğu durumlarda, doğru yanıtlardan bazılarını geçerli olarak etiketlemek bir yaklaşımdır. Bu, daha sonra bilgisayarın doğru yanıtları bulmak için kullandığı algoritmayı/algoritmaları geliştirmede eğitim verisi olarak kullanılabilir. Örneğin, sayısal karakter tanıma görevinde sistemi eğitmek için el yazısıyla yazılmış rakamların MNIST veri kümesi sıklıkla kullanılır.2

Tarihi ve diğer alanlarla ilişkileri

Makine öğrenimi terimi 1959'da bilgisayar oyunları ve yapay zeka alanında öncü ve IBM çalışanı olan Amerikalı Arthur Samuel tarafından icat edildi.34 1960'larda makine öğrenimi araştırmasının temsili bir kitabı, Nilsson'un Öğrenme Makineleri hakkındaki kitabıydı ve çoğunlukla örüntü sınıflandırması için makine öğrenimi ile ilgiliydi.5 Model tanıma ile ilgili ilgi, 1973'te Duda ve Hart tarafından tanımlandığı gibi 1970'lerde de devam etti.6 1981'de, bir sinir ağı 'nın bir bilgisayar terminalinden 40 karakteri (26 harf, 10 rakam ve 4 özel sembol) tanımayı öğrenmesi için öğretme stratejilerinin kullanımına ilişkin bir rapor verildi.7

Tom M. Mitchell, makine öğrenimi alanında incelenen algoritmaların geniş ölçüde alıntılanan daha resmi bir tanımını yaptı: "Bir bilgisayar programının performans ölçüsü "P" ve bazı "T" görev sınıflarıyla ilgili olarak "T" görevlerindeki performansı "E" deneyimiyle iyileşiyorsa "P" ile ölçüldüğü gibi E deneyiminden öğrendiği söylenir''.8 Makine öğreniminin söz konusu olduğu görevlerin bu tanımı, alanı bilişsel terimlerle tanımlamak yerine temelde operasyonel tanım sunar. Bu, Alan Turing 'in "Computing Machinery and Intelligence" adlı makalesinde "Makineler düşünebilir mi?" "Makineler bizim (düşünen varlıklar olarak) yapabildiğimizi yapabilir mi?" sorusuyla değiştirilir.9

Günümüzün modern makine öğreniminin iki amacı vardır, biri verileri geliştirilen modellere göre sınıflandırmak, diğer amaç ise bu modellere dayalı olarak gelecekteki sonuçlar için tahminler yapmaktır. Verileri sınıflandırmaya özgü varsayımsal bir algoritma, kanserli benleri sınıflandırmada onu eğitmek için denetimli öğrenmeyle birleştirilen mollerin bilgisayar görüşü kullanabilir. Hal böyle olunca, hisse senedi ticareti için bir makine öğrenme algoritması, tüccara gelecekteki potansiyel tahminler hakkında bilgi verebilir.10

Yapay zeka

Bilimsel bir çaba olarak makine öğrenimi, yapay zeka arayışından doğdu. Yapay zekanın bir akademik disiplin olarak ilk günlerinde bazı araştırmacılar makinelerin verilerden öğrenmesini sağlamakla ilgileniyordu. Soruna çeşitli sembolik yöntemlerle ve daha sonra "sinir ağları" olarak adlandırılan yöntemlerle yaklaşmaya çalıştılar; bunlar çoğunlukla perceptronlar ve diğer modellerdi daha sonra istatistiklerin genelleştirilmiş doğrusal modellerin yeniden icatları oldukları anlaşıldı.11 Olasılık muhakeme de özellikle otomatik tıbbi teşhis için kullanıldı.12

Ancak, mantıksal, bilgiye dayalı yaklaşım üzerindeki artan vurgu, yapay zeka ile makine öğrenimi arasında bir sürtüşmeye neden oldu. Olasılıklı sistemler, veri toplama ve gösteriminin teorik ve pratik problemleriyle boğuşuyordu.13 1980 yılına gelindiğinde, uzman sistemler yapay zekaya hâkim oldu ve istatistik gözden düştü.14 Sembolik/bilgiye dayalı öğrenme üzerine çalışmalar AI içinde devam etti ve endüktif mantık programlama 'ya yol açtı ancak daha istatistiksel araştırma hattı artık örüntü tanıma da (ingilizce:pattern recognition) ve bilgi geri alma daydı.15 Sinir ağları araştırması, yapay zeka ve bilgisayar bilimi tarafından aynı zamanlarda terk edildi. Bu çizgi de diğer disiplinlerden Hopfield, Rumelhart ve Hinton ‘i içeren araştırmacılar tarafından AI/CS alanının dışında "bağlantısallık" (ingilizce:connectionism) olarak devam ettirildi. Ana başarıları, 1980'lerin ortasında geri yayılım 'ın (ingilizce:backpropagation) yeniden icadıyla geldi.16

Ayrı bir alan olarak yeniden düzenlenen makine öğrenimi (ML), 1990'larda gelişmeye başladı. Alan, amacını yapay zeka elde etmekten ziyade pratik nitelikteki çözülebilir problemlerle mücadele etmeye değiştirdi. Odağı, AI'dan miras aldığı sembolik yaklaşımlar 'dan, istatistik ve olasılık teorisi’nden ödünç alınan yöntem ve modellere kaydırdı.17

2020 itibarıyla birçok kaynak, makine öğreniminin yapay zekanın bir alt alanı olmaya devam ettiğini iddia etmeye devam ediyor.181920 Ana anlaşmazlık, tüm makine öğreniminin Yapay zeka(YZ)'nın (AI) bir parçası olup olmadığıdır çünkü bu, makine öğrenimini kullanan herhangi birinin YZ kullandığını iddia edebileceği anlamına gelir. Diğerleri, tüm makine öğreniminin yapay zekanın bir parçası olmadığı görüşüne sahiptir 212223 burada, makine öğreniminin yalnızca 'akıllı' bir alt kümesi YZ'nin bir parçasıdır.24

Makine öğrenimi ve yapay zeka arasındaki farkın ne olduğu sorusu, "The Book of Why" adlı kitabında Judea Pearl tarafından yanıtlanır.25 Buna göre, makine öğrenimi pasif gözlemlere dayanarak öğrenir ve tahmin eder, oysa AI, hedeflerine başarılı bir şekilde ulaşma şansını en üst düzeye çıkaran eylemleri öğrenmek ve gerçekleştirmek için çevre ile etkileşime giren bir aracı ifade eder.

Uygulamalar

Makine öğreniminin başlıca uygulamaları makine algılaması, bilgisayarlı görme, doğal dil işleme, sözdizimsel örüntü tanıma, arama motorları, tıbbi tanı, biyoinformatik, beyin-makine arayüzleri ve kiminformatik, kredi kartı dolandırıcılığı denetimi, borsa çözümlemesi, DNA dizilerinin sınıflandırılması, konuşma ve elyazısı tanıma, bilgisayarlı görmede nesne tanıma, oyun oynama, yazılım mühendisliği, uyarlamalı web siteleri ve robot gezisidir.

İnsan etkileşimi

Makine öğrenimi sistemlerinin bir bölümü insan sezgisine olan gereksinimi tümüyle ortadan kaldırmaya çalışırken bazıları insan ve makine arasında işbirliğine dayalı bir yaklaşım benimsemektedir. Ne var ki, sistemi tasarlayan kişinin verinin kodlanma biçimi üzerinde tümüyle egemen oluşu insan sezgisinin tümüyle ortadan kaldırılmasını olanaksızlaştırmaktadır. Makine öğrenimi deneysel yöntemin otomatikleştirilmesi çabası olarak görülmektedir.

Bazı istatistiksel makine öğrenimi araştırmacıları Bayes istatistiği çerçevesi kapsamında kullanılabilen yöntemler geliştirmektedirler.

Öğrenme yaklaşımları

Makine öğrenimi algoritmaları hedeflenen sonuca göre birkaç sınıfa ayrılabilmektedir:26

Kuram

Makine öğrenimi algoritmaları ve bunların başarımına ilişkin berimsel çözümleme berimsel öğrenme kuramı olarak adlandırılan bir kuramsal bilgisayar bilimi dalıdır. Deney kümelerinin sonlu oluşu ve geleceğin tam olarak kestirilememesi nedeniyle öğrenme kuramı söz konusu algoritmaların başarımına ilişkin mutlak güvence verememektedir. Bunun yerine, başarımın olasılıksal sınırları öngörülmeye çalışılmaktadır.

Berimsel öğrenme kuramcıları başarım sınırlarının yanı sıra öğrenmenin zaman karmaşıklığı ve uygulanabilirliği konusunda da çalışmaktadırlar. Berimsel öğrenme kuramında bir berimin uygulanabilir olması için polinomsal zamanda çalışması gerekmektedir. Zaman karmaşıklığı sonuçları iki öbeğe ayrılabilmektedir. Olumlu sonuçlar belirli bir işlev sınıfının polinomsal zamanda öğrenilebileceğini gösterirken olumsuz sonuçlar bu olgunun tam karşıtını ifade etmektedir.

Makine öğrenimi kuramı ve istatistik temelde farklı kavramlar olsalar da birbiriyle yakından ilintilidir.

Ayrıca bakınız

Kaynakça

Konuyla ilgili yayınlar

  • Neural Networks and Pattern Recognition Using MATLAB, Matlab Tutorial by Ph.D. Ömer Cengiz ÇELEBİ
  • Ethem Alpaydın (2004) Introduction to Machine Learning (Adaptive Computation and Machine Learning), MIT Press, ISBN 0-262-01211-1
  • M. Fatih Amasyalı (2006) Makine öğrenimine giriş, ders notu, Yıldız Teknik Üniversitesi
  • Christopher M. Bishop (2006) Pattern Recognition and Machine Learning, Springer ISBN 0-387-31073-8
  • Bing Liu (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. Springer, ISBN 3-540-37881-2
  • Toby Segaran, Programming Collective Intelligence, O'Reilly ISBN 0-596-52932-5
  • Ray Solomonoff, "An Inductive Inference Machine"
  • Ray Solomonoff, An Inductive Inference Machine, IRE Convention Record, Bölüm: Information Theory, 2. Kısım, s. 56-62, 1957
  • Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell (1983), Machine Learning: An Artificial Intelligence Approach, Tioga Publishing Company, ISBN 0-935382-05-4
  • Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell (1986), Machine Learning: An Artificial Intelligence Approach, II. Cilt, Morgan Kaufmann, ISBN 0-934613-00-1
  • Yves Kodratoff, Ryszard S. Michalski (1990), Machine Learning: An Artificial Intelligence Approach, Volume III, Morgan Kaufmann, ISBN 1-55860-119-8
  • Ryszard S. Michalski, George Tecuci (1994), Machine Learning: A Multistrategy Approach, IV. Cilt, Morgan Kaufmann, ISBN 1-55860-251-8
  • Bhagat, P. M. (2005). Pattern Recognition in Industry, Elsevier. ISBN 0-08-044538-1
  • Bishop, C. M. (1995). Neural Networks for Pattern Recognition, Oxford University Press. ISBN 0-19-853864-2
  • Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification 2. baskı, Wiley, New York, ISBN 0-471-05669-3
  • Huang T.-M., Kecman V., Kopriva I. (2006), Kernel Based Algorithms for Mining Huge Data Sets, Supervised, Semi-supervised, and Unsupervised Learning, Springer-Verlag, Berlin, Heidelberg, 260 s. 96, ISBN 3-540-31681-7
  • Kecman Vojislav (2001), Learning and Soft Computing, Support Vector Machines, Neural Networks and Fuzzy Logic Models, The MIT Press, Cambridge, MA, 608 s. 268, ISBN 0-262-11255-8
  • MacKay, D. J. C. (2003). Information Theory, Inference, and Learning Algorithms, Cambridge University Press. ISBN 0-521-64298-1
  • Mitchell, T. (1997). Machine Learning, McGraw Hill. ISBN 0-07-042807-7
  • Ian H. Witten & Eibe Frank Data Mining: Practical machine learning tools and techniques Morgan Kaufmann ISBN 0-12-088407-0
  • Sholom Weiss & Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5
  • Ingo Mierswa, Michael Wurst, Ralf Klinkenberg, Martin Scholz & Timm Euler: YALE: Rapid Prototyping for Complex Data Mining Tasks, in Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD-06), 2006
  • Trevor Hastie, Robert Tibshirani & Jerome Friedman (2001). The Elements of Statistical Learning, Springer. ISBN 0-387-95284-5
  • Vladimir Vapnik (1998). Statistical Learning Theory. Wiley-Interscience, ISBN 0-471-03003-1

Kaynakça

Dış bağlantılar

Orijinal kaynak: makine öğrenimi. Creative Commons Atıf-BenzerPaylaşım Lisansı ile paylaşılmıştır.

Footnotes

  1. R. Kohavi and F. Provost, "Glossary of terms," Machine Learning, vol. 30, no. 2–3, pp. 271–274, 1998.

  2. Nilsson N. Learning Machines, McGraw Hill, 1965.

  3. Duda, R., Hart P. Pattern Recognition and Scene Analysis, Wiley Interscience, 1973

  4. S. Bozinovski "Teaching space: A representation concept for adaptive pattern classification" COINS Technical Report No. 81-28, Computer and Information Science Department, University of Massachusetts at Amherst, MA, 1981. https://web.cs.umass.edu/publication/docs/1981/UM-CS-1981-028.pdf

Kategoriler